查看原文
其他

「斯坦福AI团队抄袭中国开源大模型」最新进展:创始人称已经比较确信对方是套壳

针对“斯坦福AI团队被曝抄袭清华系AI创业公司面壁智能发布的开源大模型”,面壁智能创始人刘知远在知乎平台回应称:

已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳,比较有意思的证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋,就是对清华简的识别能力。

这是我们从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。

事件回顾:

1、斯坦福大学的一个 AI 团队 5 月 29 日发布了名为 Llama3V 的开源多模态模型,声称只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

2、网友发现 Llama3V 与面壁智能 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 在模型结构、代码、配置文件上高度相似,只是变量名有所不同。

3、面对质疑,斯坦福团队成员删除了在社交媒体上官宣模型的推文,并将项目在 GitHub 和 HuggingFace 上的库一并删除。

4、面壁智能团队通过测试发现,Llama3V 在识别清华简的文字时,结果与 MiniCPM-Llama3-V 2.5 高度相似,不仅在正确的地方一样,在错误的地方也雷同,且两个模型在清华简上的高斯噪声也高度相似。

5、斯坦福团队辩称只是使用了 MiniCPM-Llama3-V 2.5的tokenizer,并声称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。

6、斯坦福团队的抄袭行为引发了广泛关注和讨论,被认为是对中国国产大模型成果的抄袭。



Reference

https://www.zhihu.com/question/657971226/answer/3519010839
https://github.com/OpenBMB/MiniCPM-V/issues/196

END


热门文章

中国 Python 开源项目作者被诺贝尔奖得主邀请会面

腾讯牌安卓模拟器,微软都说好!

最适合写代码的等宽字体Cascadia Code——三年来首次大版本更新:由微软开源、新增两款Nerd字体

微软工程师真会整活,将.NET移植到40年前的任天堂NES


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存